筑波大学 人文社会科学研究科                                                現代語・現代文化専攻                                           平井 明代研究室



2020年度  英語教育学Ⅶ

 

Chapter 1  Testing, teaching and society: the language tester's responsibilities

Y.M

 

言語テスト作成者の責任は (a) 受検者の能力を正しく測定するテストを作成し、(b)テストのインパクトを可能な限りポジティブなものにしようと試みること

 

Accuracy(正確性)

言語テストは度々正確な測定に失敗する。テストが不正確な理由は2つある。第一の理由はテスト内容とテスト技術である。例としてライティング能力測定に採点の容易なMultiple choicesMC)を使用する事例がある。正確性は経済的合理性の犠牲となってきた。

■MCは広く使用されているが、教師の作るMCの質は低い。良いMCを作成することは難しく、過大な労力がつぎ込まれている。本書の目的の一つは不適切なテスト技術の駆逐と、教師の作成するテストは専門的視点で優れたものになりうることを示すことである。

第二の理由は信頼性の欠如である。信頼性のあるテストは、いつどのような条件で受検しても多かれ少なかれ同じスコアとなる。しかし信頼性の欠如したテストではスコアはさまざまな条件に左右される。

非信頼性の原因は2つである。一つは受検者とテスト自体の特徴とのインタラクションである。同じテストを異なる時期に受検したときのスコアに差異が見られる場合、受検者の個人的な要因がテストの特徴に影響することが考えられる。これらのテストの特徴を最小化することなしに、テストの信頼性は得られない。

2つ目の原因はテストの採点である。同等のテストのパフォーマンスでも採点が大きく異なる場合、採点は信頼できない。例として作文での採点者間の点数の大きな差異が挙げられる。大きな団体でのテストは信頼性が高い傾向があるが、小さいスケールのテストは信頼性が低い傾向がある。

 

Multiple measures

1つのテストでの測定よりも、複数のテストでの測定のほうが高い信頼性を示す。この場合、異なる測定をどのように統合して評価するかは問題となる。

 

Impact

■"インパクトという用語は、学習と教授の評価への効果だけでなく、評価が社会全体へ影響するという点で拡張される。

 

Backwash

テストのインパクトはbackwash (またはwashback)つまり波及効果とも言われ、害にも益にもなり得る。害になる例として、受検者にとってテストの利害関係が大きい場合、その準備に過大な労力が割かれる。またテスト内容やテスト技術と授業コースの目的が一致していない場合も害となる(ライティングコースでのMC使用など)。

一方で波及効果が益となる例に、非英語圏での英語圏大学進学への言語テスト開発がある。集中的な英語コースの最後に設定されるテストで、学生が英語圏の大学に進学して授業についていけるかを判断するために用いられる。テスト作成は進学先の大学1年生の英語のニーズ分析に基づいており、進学後に生徒が行わなければならないタスクも含む。

こうしたテストの導入は、授業コースのシラバスや教授法に影響を与える。コースの終わりには多くの生徒が高い英語基準を満たす例もあった。

■Davies(1968)は「良いテストは従順な使用人である。そのテストは指導に従いまねるためである」といった。こうした考えに著者は反論する。プログラムがよくてもテストの質が悪ければ害が生じる。逆に良いテストは悪い教授や指導の修正する影響力を持つ。

teaching and testing are partnership

 

Impact beyond the classroom

言語テストは、雇用や市民権、移民や難民などの決定など、学習環境外にもインパクトを与える。これらの目的に言語テストが用いられる問題点は2つある。1つはテストは度々不正確であることだ。例えば非英語圏からの看護師が病院で用いる英語を完璧に操れるとしても、スコアの低さによって受け入れを拒絶される事例などがある。

2つ目は政府機関などがテストスコアの必然的な不正確の性質に気づいていない点がある。人生を左右する決定が、テストスコアを用いて行われることが多く、それに自信を持てる人はいない。よって複数の測定評価の導入が検討される。

 

What should we do?

言語テストに対する教師の役割は大きい。言語評価リテラシーが高ければ、彼らの作成するテストもよりよいものになる。また言語テストに関係する他者を啓もうすることにもなる。関係者がよりテストを理解すれば、それは教授や指導にもより統合されうる。

評価を深く理解する教師は目の前の教育環境を越えて影響を与える。ライティング能力測定にMCが使用されてきた例に言及してきたが、北米の大学を目指す留学生が最も受検するTOEFL(Test of English as a Foreign Language)は1986年に30分のライティングテストを補助的に導入し、数十万の受検者のライティング能力を評価した。この原則の変更は、大学入学に用いられるTOEFLテストが教育に与える波及効果の必要性を訴える教師からのプレッシャーによってもたらされた。

■SNSでの発信の容易さが、社会での言語テストの性質と使用に対する教師の影響力を高めていく。

 

Reading activities

■1. What do you think the backwash effect of each of them is?

馴染みある試験として、大学入学共通テストを想起する。

害としての波及効果:大学入試試験の構成が高校の英語教育に大きく影響を与えている点。2021年度からの大学入学共通テストでは4技能型試験への改革がとん挫し、スピーキングとライティングなしの大量の読解問題とリスニングで構成されている。高校の教育現場では、特に進学校においてスピーキングとライティングスキルを軽視し、読解とリスニングテスト対策に特化する傾向が強くなった。

利点としての波及効果:大学入学共通テストの読解問題は従来より多い約5000語をこれまでのセンター試験と同じ時間で読む必要がある。よって難易度の高い英文の訳読よりも、中程度の英文を大量かつ高速に処理する速読力が求められ、高校教育でも多読学習を取り入れるところが増えている。これは現実世界で出会う英語を処理する際に有用な訓練であり、入試の変更が与えるポジティブな波及効果である。

.これらの試験は正確または不正確な情報を提供しているか。

大学入学共通テストは文法語法問題がなく、大量の英文を読解しリスニングできる「処理能力」を問う試験の色彩が濃い。よって英語の処理能力を測るテストとしては正確な情報を提供するが、大学に入学後求められる言語能力(論理的に考えることや、複数のテキストを読みこなして主張を論じる)を測定はできていない。その意味で、大学入学候補者についての正確な情報を提供できているかは疑問である。

3.International Language Testing Association (ILTA)code の9原則のうち、自分のテスト環境にもっとも関連するものは、原則7である。

Principle 7

Language testers in their societal roles shall strive to improve the quality of language testing, assessment and teaching services, promote the just allocation of those services and contribute to the education of society regarding language learning and language proficiency.

 

私は高校教師であるが、定期考査では他の教師と分担し、共通テストを作成する。生徒や社会への影響を考えると、常にテストの質と評価の質を向上させる努力が不可欠であるが、膨大な業務量を前にして、基本的に前例踏襲の色が濃い。英語教師はテスト評価リテラシーを持ち、テスト作成と評価に責任を持tて、同僚や組織に対してもテストの質改善を働きかけるなどの必要性を改めて感じる。

 

4.もしあなたがオンラインでの言語テストへの嘆願を書くとすればどうするか

言語テストをより現実世界で出会うテキスト環境に近づけてほしい。

現在の言語テストは実社会で学生が触れる英語の処理を反映できていない。例えばインターネット環境では、特定の問題に対して、補完的な情報や対立する情報を複数目にすることが多い。誤った情報に繰り返し触れることで知識の偏りが生じることもある。そこで対立する情報を読んでバランスの良い知識を獲得することが実社会では不可欠である。しかし言語テストでは複数テキストの読解についての作問は限定的である。言語テストで複数テキスト問題の比重が少ないと、学校教育で複数テキストの評価や読解を行うことも少なくなる。負の波及効果である。

 

Discussion points

■Choose one or two English tests. What do you think the backwash effect of each of them is?

 

■you are an English teacher in Japanese high school. You are allowed to make your own English test at the end of academic year (March). What kinds  of English test do you want to make?

 

■In university entrance exam (大学入学共通テスト), the skills assessed are only reading and listening. Do you believe it is appropriate? Do you support it or oppose it? Give us your position and specific reasons.